程序体积优化的十个小妙招
大家好,我是程序喵,众所周知,前两天,小破站又上市了,慷慨的宣布要给员工加鸡腿,激动的喵哥一夜没睡好,万万妹想到啊,人算不如天算,公司真的发了鸡腿,没错,就是你想的那个。
鸡腿啥的不想了,我还是安心肝文章吧。。。
前一段时间在知乎上看到个问题:Linux如何优化可执行程序的体积?
在我们的日常工作中,一般对程序的体积都有严格的要求,有时候仅仅因为几字节的代码段体积或者多了几十毫秒的运行时间,整个项目就达不到验收标准,甚至不能成功上线。这里我抛砖引玉先提出几个思路,大家如果有好的优化策略欢迎打在评论区。
大体思路有这些:
好好写代码,减小代码段体积,别人300代码的逻辑我们50行搞定,程序体积肯定有机会更小一些,这个就得考验开发者自己的编程功底了
如果是C++程序,可以尽量减少模板的使用,模板实例化可能会导致代码膨胀
不用引用没有用的头文件
使用strip,像脱衣服一样,移除程序的所有符号,这也是很多开发者常用的方式
strip只会清除普通符号,不会动态符号表中的符号,某些动态符号其实也可以隐藏掉,进而来减小库的体积,可以使用-fvisibility=hidden命令
巧用.bss段,未初始化的全局变量和局部静态变量会存在.bss段中,这些变量不占用程序空间
inline-limit:内联过多会导致代码段体积较大,可以通过此优化选项减少内联的数量
开启Os编译,这是产生较小代码体积的优化选项
适当使用编译选项-fdata-sections和-ffunction-sections
考虑链接动态库而非静态库
以上说的太笼统了?贴心如我早就准备好了,不谢~
strip使用
在Linux中可以使用man strip查看strip使用方法,最主要的就是移除所有符号的-s参数,用于清除所有的符号信息:
strip -s xxx
在使用strip之前先使用nm查看下可执行程序的符号信息:
~/test$ nm a.out
0000000000200da0 d _DYNAMIC
0000000000200fa0 d _GLOBAL_OFFSET_TABLE_
000000000000089b t _GLOBAL__sub_I__Z4funcPc
0000000000000930 R _IO_stdin_used
w _ITM_deregisterTMCloneTable
w _ITM_registerTMCloneTable
0000000000000852 t _Z41__static_initialization_and_destruction_0ii
00000000000007fa T _Z4funcPc
000000000000081c T _Z4funci
U _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4
U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.4
0000000000201020 B _ZSt4cout@@GLIBCXX_3.4
0000000000000934 r _ZStL19piecewise_construct
0000000000201131 b _ZStL8__ioinit
U _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.4
0000000000000b24 r __FRAME_END__
0000000000000940 r __GNU_EH_FRAME_HDR
0000000000201010 D __TMC_END__
0000000000201010 B __bss_start
U __cxa_atexit@@GLIBC_2.2.5
w __cxa_finalize@@GLIBC_2.2.5
0000000000201000 D __data_start
00000000000007b0 t __do_global_dtors_aux
0000000000200d98 t __do_global_dtors_aux_fini_array_entry
0000000000201008 D __dso_handle
0000000000200d88 t __frame_dummy_init_array_entry
w __gmon_start__
0000000000200d98 t __init_array_end
0000000000200d88 t __init_array_start
0000000000000920 T __libc_csu_fini
00000000000008b0 T __libc_csu_init
U __libc_start_main@@GLIBC_2.2.5
0000000000201010 D _edata
0000000000201138 B _end
0000000000000924 T _fini
0000000000000688 T _init
00000000000006f0 T _start
0000000000201130 b completed.7698
0000000000201000 W data_start
0000000000000720 t deregister_tm_clones
00000000000007f0 t frame_dummy
000000000000083d T main
0000000000000760 t register_tm_clones
当前这个可执行程序的文件大小是8840字节:
-rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out
使用strip清除符号信息:
~/test$ strip -s a.out
strip后再查看可执行文件的符号信息:
~/test$ nm a.out nm: a.out: no symbols
发现什么符号都没有了,但还是可以执行。
strip后的可执行程序文件大小是6120字节:
-rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out
具体可以看我这篇文章:《Linux有一个命令你一定要知道》
-fvisibility=hidden可以这样使用:
$ g++ -fvisibility=hidden -c layer.cxx -o layer.o
具体可以看:《硬核好文:原来编译链接还有这么多套路》
巧用.bss段:
看下面代码:
#include <stdio.h>
int a[1000];
int b[1000] = {1};
int main() {
printf("程序喵\n");
return 0;
}
我们查看下文件大小和各个段大小:
$ gcc testlink.c -o test
$ ls -l test
-rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test
$ size test
text data bss dec hex filename
1512 4616 4032 10160 27b0 test
再看这段初始化的代码:
#include <stdio.h>
int a[1000] = {1};
int b[1000] = {1};
int main() {
printf("程序喵\n");
return 0;
}
再查看下文件大小和各个段大小:
$ gcc testlink.c -o test
$ ls -l test
-rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test
$ size test
text data bss dec hex filename
1512 8616 8 10136 2798 test
可以看到仅仅是做了一次初始化,文件大小就从12368变成了16368,正好是初始化了的那a[1000]的大小,这4000字节从.bss段移动到了.data段,程序大小增加了,这里可以看出.bss段不占据磁盘空间。
具体可以看:《谈谈程序链接及分段那些事》
巧用-fdata-sections和-ffunction-sections:
现在的程序和库通常来讲都很大,一个目标文件可能包含成百上千个函数或变量,当需要用到某个目标文件的任意一个函数或变量时,就需要把它整个目标文件都链接进来,也就是说那些没有用到的函数也会被链接进去,这会导致链接输出文件变的很大,造成空间浪费。
有一个编译选项叫函数级别链接,可以使得某个函数或变量单独保存在一个段里面,都链接器需要用到某个函数时,就将它合并到输出文件中,对于没用到的函数则将他们抛弃,减少空间浪费,但这会减慢编译和链接过程,GCC编译器的编译选项是:
-ffunction-sections -fdata-sections
具体可以看:《程序一定要从main函数开始运行吗?》
最后,大家有什么好的优化策略欢迎在留言区留言。
往期推荐